Vol.03 AI产业的“摇钱树”会在哪一层?
往期必看
卷首语
通用人工智能这个概念的有趣之处,就在于每天都会有新想法和新东西。说实话,很久没有遇到ChatGPT这样,玩了好久你也不会腻的东西了。大部分的新产品,玩个一两天就觉得无聊了;少量新产品,能够让你晚上两个礼拜。但是ChatGPT已经玩了2个多月了,但是每天都会有新的 Wow 的时候。
围绕着ChatGPT,总会有一开始觉得很棒的新创意,但是因为技术门槛的大幅度降低,又很容易抄袭和被抄袭。每看到一篇新的论文,都是又兴奋,又觉得显而易见。
在过去的两个月之后,身边也有不少投资人和创业者开始行动起来了。虽然大家并不知道终点是什么,但是知道这一次不参与一定会后悔。
而这一期里,我们仍然会通过4篇内容来聊聊我们对于新浪潮之下,机会会在哪里:
1. 相信很多人很关心的一个问题是 AI产业哪一层能赚钱,任鑫在看了一圈,把现有的产业分成 硬件、云平台、标记、研究和应用之后觉得还是很难判断。特别是应用层,在大模型把应用门槛降到最低之后感觉就是一个血海。不知道你在这一点上怎么看。
2. 而我在看到了Meta发表的这篇 Toolformer 的论文之后,更加相信我们离AGI越来越近了。通过大模型的语义理解能力,再去调用外部能够给到准确结果的API或者知识库,很多原本ChatGPT”表现不佳“的领域都可以被很好地解决。
3. 选择做什么?大模型还是应用?还是存在一个中间层的选择?任鑫想要挖掘究竟整个产业未来会是怎么样的。除了大模型和ChatGPT之外,未来还会需要什么样的基础设施呢?在最显而易见的写作助手之外,应用层又需要那些东西?
4. 而最近常带娃儿的我,又有了一个新问题 —— 那就是未来的人会变成什么样呢?00后是移动互联网的原住民,他们习惯于手机输入大量资料,习惯于通过短视频获取信息和知识。当AGI渗透到生活的方方面面之后,10后甚至20后将来还要去背诵九九乘法表么?
欢迎给我们留言,和我们一起多聊聊你对AGI时代的思考和展望。
——徐文浩
1
AI BUSINESS
AI 产业哪一层能赚钱
一方面,我们可以使用大量比喻性的方式来理解和寻找机会——比如ChatGPT到底是浏览器、操作系统还是蒸汽机;另一方面,我们可以从商学院的角度,对产业进行简单拆分,看看各个层面的状态和可能性。Richard 这篇 Profits in AI 给了我很多启发。
一般来说,人工智能产业有五个不同的层次。
硬件:Nvidia, Intel, AMD and TSMC 云平台:AWS, Azure, GCP and Oracle Cloud 标记:Scale AI, Appen, Hive, Labelbox … 研究:Open AI, Deepmind, Stability, and Anthropic 应用:Copy.AI, Midjourney, Github Copilot…
硬件层能受益,但利润有限。
从设计方来看,Nvidia 很强,Intel 也还在,Google 还有自己的 TPU;从生产方来看,台积电很强,但别的工厂也有能力抢生意,让它无法抬高溢价;而从销售走向看,最可能的大买家是少数几个大型云平台,这些平台看重性价比、议价能力也很强。
光看利润,这些公司应该都不错。但如果把技术路线锁死的风险,和大规模固定资产投资的风险,都算进来的话,那部分利润就不那么值得羡慕了。
云平台或许收益最大,在硬件采购上有选择,但在销售上仍然可能做出差异化利润。
从 Stability 和 Dall-E 的战果看,研究(模型)层的先发优势极其明显。Stability 比 Dall-E 先公开给大众 1 个月,就抢走了绝大部分关注度。从竞争角度,会导致研究(模型)层不惜代价抢云算力,加快自己的迭代,获得先发优势。
标记公司也有几十亿美金估值,但可替代性过强,很难拿到高利润。而且,目前看很可能未来也不一定需要大量的人类劳动来做标记。
研究(模型)层很难获利,主要是因为成本高企。
人才很贵,训练很贵,而赚钱会很慢——因为模型层本质上是做平台,而不是应用,需要先养生态。所以,OpenAI 才会放弃那么高的股票份额换取微软投资,没有巨额资金根本玩不转这个游戏。
而高融资带来的光环效应,可能会创造和引发更激烈的竞争,让更多的钱涌入支持竞争企业,让已有玩家赚钱更难。
应用层感觉比较好做,但也比较薄。
应用层比较舒服的点是离商业化比较近,很容易收钱,而且其实对研究层没有绑定,可以敏捷更换更好的 AI 模型来支持自己的应用。
但是,这一层也很薄,很容易被颠覆。和朋友聊起来最多的例子就是 Jasper,ChatGPT 升级后吃掉他一口(用 ChatGPT 可以实现大部分它的功能),而 Notion 之类笔记软件增加 AI 模块之后又能吃掉它一口。我现在就正在 Notion 里编辑这篇文章,每写一段都会让 Notion 帮我 AI 润色一下。这种无缝体验会极大降低我去体验独立的文档优化工具的动机。
目前在创业老兵这边,比较共识的观点是 AI 应用会爆炸,但是很难建立壁垒,很可能有百万级的(是的,现在一个人也非常容易搞出三五个好用的 AI 应用)应用方生方死,看起来站在时代的风口浪尖,实际上身处一片血腥红海。从战略上讲,站在这个红海的上游(比如基建提供)或者下游(比如服务商)可能是更有确定性的生意。
相关延伸
《人工智能时代的新商业设计》Vol.01 来了来了!通用人工智能(AGI)真的来了
https://snowingpine.com/2023/01/25/profits-in-ai
2
MODELS
Toolformer,又向AGI靠近一步
大家在玩ChatGPT的时候,都会遇到一个问题,就是AI的算术能力并不好。如果是简单的一二位数的计算,它大部分都还能算对,但是来个三位数乘法,往往就会胡扯一个差不多但是不正确的答案。
实际答案应该是 169435,ChatGPT基本上都是算个大概
这个,也是很多人认为,ChatGPT只是一个大语言模型,并不真的蕴含任何智能。我之前虽然不认同这个观点,但是的确也很难辩驳。毕竟大家手上谁都没有大模型都只能根据自己用ChatGPT的体验胡扯。直到Meta的这篇论文出来,进一步加强了我的想法,也多了一些实证。
Toolformer的论文里,不再依赖于语言模型,而是调用外部API来进行数学运算和维基百科的搜索
这篇论文,想到了一个有趣的解决AI不会算算术的办法。那就是,只让语言模型解决语义理解问题,然后让模型根据对于语义的理解,自己判断是不是应该调用一个外部的API,并且提取出合适的参数传给他。如果要打一个比方的话,就是让AI听懂了输入,然后在算算术的时候不是自己心算,而是去按计算器。该不该按计算器,往计算器里输入什么内容是AI自己判断的。
这样一来,AI不仅能胡扯,未来AI也能自己决定通过API“做些什么”。如果再做一些极端的想象,科幻片里AI毁灭人类的事情完全可以发生。AI完全根据外部信息,决定调用某个无人机发射导弹的API。AGI离我们越来越近,不过似乎这个世界也越来越危险了。
相关延伸
https://twitter.com/mathemagic1an/status/1624870248221663232
论文:https://arxiv.org/pdf/2302.04761.pdf
3
AI BUSINESS
AI 基建 vs. AI 应用
从历史看,其实科技发展一浪一浪,总是应用程序带来了基础设施,然后产生了更好的应用,然后需求拉动了更强的基础设施……
1970 年有 IM,1972 年有Email。
而1973 年才出现 Ethernet,1973 年出现 TCP/IP,1974 年出现 ISP;
然后是新一波的应用,1991 年门户网站 AOL,到 1993 年才有第一款流行的浏览器 Mosiac;
1994 年出现 Amazon.com 这样的早期网站,同期有了 PHP,一年后有了 Javascript 和 Java;
1999 年出现 Napster,2000 年 Pandora,2004 年 Gmail 和 Facebook,2004 年出现 NGINX 和 Ruby on Rails,2006 年 AWS 上线……
灯泡(应用程序)是在电网(基础设施)之前发明的;飞机(应用程序)是在机场(基础设施)之前发明的。
应用表达了自己的潜力之后,基础设施兴起,帮助应用普及落地。
当时到底是要做应用还是做基础设施呢?如果是做应用,是什么新的基础设施出现,让这件事情可行了呢?还是预测未来几年出现什么新基础设施(比如 ChatGPT)提前布局呢?
如果是做基础设施,那么已经被少数人接受的会话式商业的具体应用是什么,它们遇到了什么规模化的困难是我提供新的基础设施可以解决的?
相关延伸
https://www.usv.com/writing/2018/10/the-myth-of-the-infrastructure-phase/
https://xiaobot.net/p/pmthinking2023?refer=a2db3eb3-3317-4059-a37d-a93dd0771957
4
AGI
在AGI下长大的新一代人
从外包“记忆”到外包“智力”
作为一个80后,在我长大的过程里,并没有智能手机、移动互联网、短视频和微信。电脑虽然接触得早,但也是到了高中才有,而且住校平时也没什么机会用。我大部分年少时候的娱乐是读“书”,这个“书”代表各种各样的文字作品。报纸、杂志、漫画、小说、课本,听磁带。因为信息渠道的匮乏,我什么都读,很多东西都反复读了很多遍。
这个习惯似乎对于中小学阶段的学习成绩似乎是有利的。毕竟学校的教育注重背诵而不是理解,你只需要知道鸦片战争发生在哪一年,世界最高峰是什么,就能得到一个好成绩。但是1840年同时代的世界到底是一个什么样子,为什么会变成那个样子其实你并不理解。即使有需要“理解”的题目,你需要“理解”的也是一个“标准答案”。
曾几何时,打字也是一门专业技能
不过,曾经你能记住那么多“知识”就算得上是有文化了。不过,这一点在有了搜索引擎之后其实实用价值就大大降低了。能背得出的古诗多的人原本可能高人一等,但是现在谁都能拿手机立刻搜出来。在互联网和搜索引擎出现之后,我们对于知识的“记忆”就可以外包了,你只需要能够记得一些“索引”性质的信息,很快就能在网上找到答案。
而在AGI不断往前走的过程里,不仅“记忆”可以被外包了,“智力”也可以被外包了。你甚至不需要知道搜索的关键字是什么,提出问题,然后不断深入,ChatGPT一样可以帮助你解决掉。似乎我们只需要有最宏观的概念和想法,一切具体操作落地的事情都可以交给AI去解决了。
👉 Vol.02 ChatGPT 说:你丫就是个翻译官!
在上一期里,我们觉得,也许知识的本质就是“翻译”
我们在塑造AI,AI也在塑造我们
但是,如果我们回顾一下这个教育过程,“记忆”并不是没有用的。更复杂的知识、理解往往伴随着对更基础的知识的掌握和积累。尽管你今天不再需要背诵九九乘法表,但是作为愚昧落后的人类,你不得不经历这整个过程才能学会微积分和概率论。“智力”更是这样,如果你没有对于AI从基本的多变量微积分到Transformer和强化学习的一系列的理解,我们并不能靠少数的想法来创建ChatGPT。
虽然今天的教育并没有跟着技术的变化真的做出很多改变,但是技术的进步已经让每一代人的习惯和工作方式完全不一样了。比如我自己,就还是习惯于写任何一点东西都要用上键盘,始终适应不了用手机进行大量文字输入,而更年轻的一代则已经习惯语音输入了。我们家不到10岁的小朋友,还不会输入法,我原本以为看电视找节目他会找我帮忙,却没想到他自己已经对着遥控器用语音输入了。这让你很难想象,在我中学的时候,打字还是一门专门要单独学习的课程。
当然,不是所有的技术进步都给了我们正面感受。比如,微信和各种IM的出现,让我逐渐失去了长时间集中注意力的能力。无论是工作、旅行、生活,总是习惯于没隔多长时间就要点开IM看一下。就在写这篇文章的过程里,我都切换出去了好几次。某些时候,我都想把缺少产出怪罪在IM上,我们似乎因为它,习惯了碎片化的工作,碎片化的思考,碎片化的娱乐。在这个过程中,我们的大脑也被塑造成很难集中注意力超过15分钟。
看了一下iPhone的使用时间,过去一周平均每天要用4个小时手机
回到ChatGPT和AGI上来,我已经看到有朋友开始改造家里的智能音箱,连接OPEN AI来让AI伴你左右了。当我们习惯了任何一个问题都会快速有一个答案,甚至AI可以帮我们做完之后,我们还会有耐心继续去学习这些知识么?在这个过程里,AI有着强烈的两面性。一方面,它可以让每一个人都有一个个性化的学习过程,每一个人都有一个针对自己的家庭教师。另一方面,既然任何事情问AI就有答案了,我们是否会失去学习的动力?
我们现在大部分的“知识工作”,伴随着12年的基础教育和4年的大学。然后进入一个公司,从一些简单的基础工作开始干起,直到3年或者5年之后,才能做更复杂的事情,从程序员到架构师。如果当所有的初级岗位都可以被AI代替了我们应该怎么办?是所有人都不得不花更多的时间在学校里,读到硕士博士,才能工作赚钱,还是更悲观的随着现在一代人的老去,已经很少有人能掌握足够的知识把世界再往前推一步了。
魅力是唯一的出路么?
在越来越多的事情上,AI已经能够和人类比肩了。比如写作,在未来5年内,如果AI能够写出媲美优秀作者的Essay并不会让我觉得意外。到时候,写得一手好文章的本事可能就不再重要了。那么,重要的会是什么?Tyler觉得很可能是魅力,自信、外向,直接在现实世界面对面可能对其他人更有“价值”。
事实上,过去几年已经有越来越多的人跑去做“网红”或者KOL。即使在线下实际可能安静内向的人,在镜头下手机里也要显得艳光四射。因为信息和知识实在太透明了,唯有情感大家难以获得。不过,这样的世界是否会逐步走向「三体」里面的大低谷那样,变成一个弥漫享乐氛围的社会?我没有答案,只是从现在开始,世界从此不同了。
相关延伸
https://www.chinatalk.media/p/tyler-cowen-on-ai
待办清单
本期互动
直播预约
全平台搜索关注